Corpus: tat_web_2018_300K

Other corpora

2.4.11 Distribution of Digit - in Words

Number of words containing a fixed number of occurrences of the specified character


Gnuplot diagram

# of occurrences # of words Sample word
0 248565 !
1 18855 -
2 511 Би-би-си
3 29 Ай-Лунх-Кал-Юган
4 5 Европа-Россия-Татарстан-Казакъстан-Кытай
5 1 Итальянча-французча-инглизчә-алманча-каталанча-сардинча
12 1 Мәскәү-Калуга-Воронеж-Курск-Харкау-Одесса-Николаев-Херсон-Симферополь-Севастополь-Воронеж-Мәскәү-Петербург
14 1 Казан-Җаек-Кустанай-Астана-Алматы-Атакент-Кентау-Төркестан-Алматы-Хоргос-Өремче-Чүгүчәк-Голҗа-Алматы-Караганда
15 1 Костанай-Астана-Балхаш-Алматы-Шымкент-Атакент-Кентау-Төркестан-Алматы-Хоргос-Өремче-Чүгүчәк-Голҗа-Хоргос-Алматы-Караган
555 msec needed at 2018-06-27 11:02